Función que nos permite obtener el ranking utilizando el test no paramétrico de wilcoxon.

RSME

Lectura de la tabla con el RSME en cada fold

Se elimina la columna con los pliegues porque esa información está en el índice

Mostramos un diagrama de cajas para cada uno de los modelos

Primero analizamos si las diferentes muestras (resultados de la validación cruzada por cada modelo) proceden de una distribución normal. Para ello vamos a aplicar el test de Shapiro-Wilks.

Como pdemos ver, exite un pvalue que es menor que el nivel de significancia del 0.05, GBR_lag3 con lo que en ese caso la distribución no sigue una distribución normal. Esto lo podemos ver de forma gráfica.

Como se puede ver no se detectan diferencias signficativas. Si intentamos aplicar el test de Nemenyi tampoco las encuentra.

Para facilitar el cáluclo de la matriz de ranking, vamos a utilizar la función que definimos antes que utiliza el test de Wilcoxon.

MAE

Al igual que antes he hecho el test en R y se rechaza la hipótesis nula de que se cumple la esfericidad

R^2

En este caso podemos ver que las distribuciones proceden de una distribución normal. Esto nos lleva a comprobar lo otra condición de parametricida, la homocedasticidad o la esfericidad. Para ello vamos a aplicar el test de Mauchly

De la mismoa forma que hemos hecho para el caso no paramétrico, para automatizar los cálculos vamos a aplicar el T-test con la corrección de Bonferroni.

CC

Lectura de la tabla

La distribución para RF_lag5 no es normal. Tampoco para GBR_Lag5

Sin diferencias significativas. Probamos con Nemenyi